Lo script che andiamo a vedere oggi è utile quando si intende convertire un testo originariamente scritto in HTML in un qualunque formato differente. Ad esempio, può essere usato per rimuovere script potenzialmente pericolosi dai messaggi inviati a Chat e Forum.
E' facilmente personalizzabile e fa uso delle Regular Expression per eliminare i tag HTML da ignorare.
<%
Function sHTMLtoTXT(sHTML)
Dim reHTML
Set reHTML = New RegExp
' pattern per la rimozione dei tag HTML
reHTML.Pattern = "<[^>]*>"
reHTML.Global = True
' ignora maiuscole/minuscole
reHTML.IgnoreCase = True
' converto i caratteri speciali di formattazione
sHTML = Replace(sHTML, "<BR>", vbCrLf)
' qui posso modificare la formattazione sui
' tag che mi interessano, prima di eliminarli
' ESEMPIO:
' sHTML = Replace(sHTML, "<HR>", vbCrLf)
' applico la Regular Expression,
' sostituendo "" (stringa vuota) ai tag HTML
sHTMLtoTXT = reHTML.Replace(sHTML, "")
End Function
' RIGA DI TEST
Response.Write (sHTMLtoTXT("<B>Ciao.</B><BR>Seconda riga!"))
%>
Fonte: webmasterpoint.org